Le dataset étant assez conséquent, nous avons procédé par étape. Tout d’abord, quelques lignes n’ont pas été importées d’une manière utilisable. Nous les avons donc converti dans une unité qui nous convenait (caractères pour les flags par exemple). Pour les dates, nous avons utilisé le format Date, qui nécessite un jour. Or, nos données ne contiennent que le mois et l’année. On a donc placé toutes les dates au premier jour du mois.
On a ensuite voulu voir un peu la qualité de nos données. Après un affichage des premières stations pour vérifier que les variables avaient une bonne tête, nous avons isolé la première station affichée grâce à son ID : 01001. Avec ça, on a pu représenter l’évolution des températures moyennes à cette station (pendant la période des relevés). Un premier filtre a du être réalisé sur les données (qui d’ailleurs sera appliqué sur presque chaque graphe suivant), pour enlever les relevés qui n’ont pas de valeur. Par défaut, notre dataset nous informe de cette absence en mettant la valeur à soit 9999, soit -9999. On a donc gardé les valeurs qui étaient entre -800 °C et 800 °C (choix totalement arbitraire).
Une première représentation avec un geom_line() nous rappelle que les saisons existent. Il nous faut donc une représentation plus stable sur l’année. On peut même garder la première représentation et juste ajouter une moyenn pour y voir plus claire.
On vient donc de démontrer le réchauffement climatique.
Plus sérieusement, en prenant une première station au hasard, on voit déjà que la température moyenne a augmenté de plus de 2 °C pendant les dernières années, faisant même dépasser la barre des 0 °C moyens de la station. Cette dernière donnée est d’ailleurs assez étonnante. Où est-ce que notre première station peut bien être ?
## Regions defined for each Polygons
Les conditions y sont un peu extrêmes, donc on va chercher des stations plus proches de chez nous. Cela nous permettra en plus de s’assurer que notre dataset a des relevés bien répartis.
A vue de nez, on va situer la France dans une longitude entre -4.5 et 7, et dans une latitude entre 42.7 et 50.7, pour filtrer toutes nos stations. On va ensuite les grouper par ID pour avoir une seule donnée par station.
Le filtre par longitude/latitude n’est pas parfait, la France n’ayant pas la forme du Colorado; il laisse passer quelques stations d’Espagne de la côte Nord, et une du Royaume Uni vers Plymouth. On aimerait tout de même avoir la moyenne de température sur toutes ces stations. On va donc grouper nos relevés par mois, en gardant la moyenne de toutes les stations sur ce mois-ci.
On retrouve donc une évolution moins extrême, mais qui est toujours là (surtout dans les dernières années).
On aimerait retrouver les périodes de grande chaleur dans les dernières années. La température maximale enregistrée convient parfaitement à notre besoin.
On peut ici bien démarquer deux années vers 2005 : ce sont les canicules de 2003 et 2006, la première faisant 15.000 morts. Est-ce qu’on peut isoler d’autres évènements importants des dernières années ?
On va s’intéresser ici à l’Australie, et plus particulièrement aux feux dont on a autant entendu parler en 2020.
On va commencer par regarder les températures moyennes de l’Australie pour se donner un peu une idée du pays. On peut les comparer avec la France et le monde entier.
Pour notre objectif initial, l’Australie a bien 10 °C de plus sur l’année que le France ou le reste du monde. Mais est-ce que c’est vraiment ça la température sur le reste du monde ? On peut remarquer que la moyenne sur le monde entier correspond plus à un pays de l’hémisphère Nord qu’une moyenne entre les deux … peut-être à cause de la répartition des stations ?
Et il y a bien 3 fois plus de relevés dans le nord que dans le sud. Il peut alors être intéressant d’essayer de corriger cette inégalité. Une simple division nous donnant un ratio de 3.596679, nous allons dupliquer les relevés de l’hémisphère Sud.
## [1] 3.596679
Le résultat obtenu est assez satisfaisant, étant donnée notre technique de duplication des relevés un peu approximative. On se rapproche plus d’une moyenne entre les deux hémisphères, même si le côté Nord se fait encore assez ressentir.
On va maintenant s’intéresser uniquement à l’Australie, et plus particulièrement ses feux. Les données intéressantes de notre dataset seraient alors la température maximale atteinte, et la quantité de précipitations au cours des années.
L’échelle de la pluie est complètement cassée, nous avons du l’adapter pour qu’elle soit facilement comparable à la température. La corrélation vient des saisons (janvier étant le milieu d’été en Australie). Si vous vous en souvenez, les feux en Australie ont commencé à être vraiment diffusés mondialement courant Mars 2020. Cependant, il s’avère que les feux duraient alors depuis bien longtemps, et ont commencé vers Juin 2019 (ligne en rouge sur le graphique), début de période que l’on peut remarquer comme étant très sèche et avec une température très élevée par rapport au reste de la décennie. La plupart des feux de cette période s’avèrent avoir été commencés par de la foudre, dont la fréquence augmente en cas de sécheresse et haute température. En poussant un peu plus les recherches, on a appris que la sécheresse - et les feux - ont été principalement sur la côté Est. Est-ce qu’on peut noter la différence par les graphes ?
En terme de température, on peut en effet noter une légère différence.
Mais c’est en terme de précipitations que la différence s’est fait ressentir. Une pluie faible tout au long de la période, et une saison des pluies très insuffisante.
La différence Nord/Sud dont nous avons parlé plus tôt est très intéressante. On aimerait voir si on peut séparer la Terre en différents zones de chaleurs de la même manière.